تشخیص مرزهای تکواژی در زبان فارسی بر اساس اطلاعات واجی (با هدف کاربرد در برنامه‏های رایانه‏ای پردازش زبان)

پایان نامه
چکیده

این پایان نامه با عنوان «تشخیص مرزهای تکواژی در زبان فارسی بر اساس اطلاعات واجی (با هدف کاربرد در برنامه ‏های رایانه ‏ای پردازش زبان)» به بررسی روش تجزیه ساختواژی پیشنهادی هریس (1995) و میزان کارآمدی این روش بر روی زبان فارسی می‏پردازد. هدف از انجام این تحقیق این است که با آزمودن مدل تجزیه ساختواژی هریس بر روی داده ‏های نوشتاری زبان فارسی، امکان استفاده از آن را در برنامه ‏های پردازش زبان فارسی برای تجزیه تکواژی مشخص کند. برای آزمودن روش هریس از پنجاه جمله فارسی استخراج شده از پایگاه داده ‏های زبان فارسی برای جامعه نمونه استفاده کردیم. به دلیل عدم وجود پیکره زبان فارسی مناسب برای آزمودن فرضیه این پژوهش از سه گویشور زبان فارسی برای جمع ‏‏آوری سایر داده ‏ها کمک گرفتیم. سپس داده ‏های جمع ‏آوری شده را به صورت دستی، واج ‏نویسی کردیم و به شمارش تعداد متغیر همنشینی واج ‏ها پس از هر واج پاره ‏گفتارها پرداختیم. تقطیع پاره ‏گفتارها در نقاط اوج تعداد متغیر همنشینی، تکواژهای به دست آمده از این روش تقطیع را مشخص نمود. نتایج این آزمون بر روی جامعه نمونه نشان می‏دهد که تقطیع ساختواژی با دقت 97% و بازیابی 75% صورت گرفته است. میزان دقت 0/97 این روش برای تعیین مرزهای تکواژی، نتیجه بسیار خوبی است. نکته مهم این است که این نتایج از پردازش یک پیکره برچسب ‏گذاری نشده، به دست آمده است. با اینکه در آزمودن روش هریس تکواژهای فارسی با دقت خوبی به دست می‏آیند به نظر می‏رسد این روش نمی ‏تواند به عنوان مدل رایانه ‏ای برای پردازش ساختواژی متون فارسی به کار گرفته شود و نتایج قابل قبولی را برای کاربرد در موتورهای جستجو، ماشین ‏های ترجمه و یا دیگر برنامه ‏های پردازش زبانی ارائه دهد. با این وجود از آن‏جا که در برنامه ‏های تبدیل گفتار به متن، آواها به صورت خام به دست می ‏آیند، به نظر می‏رسد این مدل بتواند متون آوانویسی شده فارسی را با دقت خوبی به تکواژها تجزیه کند و ازاین ‏رو در برنامه ‏های پردازش گفتار به کار رود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

تحلیل فرایند‏های واجی فعل در زبان فارسی

در این پژوهش، با تحلیل فرایند‏های واجی ستاک گذشته در زبان فارسی بر‏حسب میزان پیچیدگی و تعداد قاعده‌هایی که برای تبدیل به ستاک گذشته، بر ستاک حال آنها انجام می‏شود، این فعل‏ها را به انواع تک‏قاعده‌ای، دو‏قاعده‌ای، سه‏قاعده‌ای و چهار‏قاعده‌ای تقسیم کرده‏ایم. در هر‏یک از این دسته‏ها، یک قاعده، از‏نوع ساخت‏واژی ستاک گذشته و بقیه، قاعده‌های آوایی هستند. پژوهش حاضر، بیانگر آن است که علاوه‏بر عناصر وا...

متن کامل

تحلیل فرایند واجی قلب در زبان فارسی

مقالۀ حاضر به بررسی فرایند قلب در زبان فارسی می‌پردازد. معمولاً قلب فرایندی نظام‌مند تلقی نمی‌شود و درمیان انواع فرایندهای واجی به‌صورت فرایندیی و فرعی درنظر گرفته می‌شود. بااین‌حال، در برخی از زبان‌ها فرایندی منظم و قاعده‌مند است. به‌نظر می‌رسد فرایند قلب اگر "هدف ساختاری خاصی" را تأمیی‌تواند منظم باشد. این هدفِ ساختارییتی عام و واجی داشته باشد. تحلیلِ آن در زبان فارسی نشان می‌دهد که این فرایند د...

متن کامل

فرایندهای واجی همخوانی در واژه‌های مشترک بین زبان فارسی معیار و زبان هورامی (گویش هورامان تخت)

هدف از نگارش این مقاله، بررسی و توصیف فرایندهای واجی همخوانی در واژه­ های مشترک بین زبان فارسی معیار و زبان هورامی (گویش هورامان تخت)، یکی از زبان­ های ایرانی نو شاخۀ شمال غربی، است. برای گردآوری و ثبت داده ­ها، از ده گویشور بومی بی­سواد و با­سواد از زن و مرد در سنین بین 30 تا 80 سال در حدود 5 ساعت بهره گرفته شده است. از شمّ زبانی یکی از نگارندگان که گویشور بومی این گویش است و همچنین منابع مکتوب...

متن کامل

تحلیل فرایند‏های واجی فعل در زبان فارسی

در این پژوهش، با تحلیل فرایند‏های واجی ستاک گذشته در زبان فارسی بر‏حسب میزان پیچیدگی و تعداد قاعده هایی که برای تبدیل به ستاک گذشته، بر ستاک حال آنها انجام می‏شود، این فعل‏ها را به انواع تک‏قاعده ای، دو‏قاعده ای، سه‏قاعده ای و چهار‏قاعده ای تقسیم کرده‏ایم. در هر‏یک از این دسته‏ها، یک قاعده، از‏نوع ساخت‏واژی ستاک گذشته و بقیه، قاعده های آوایی هستند. پژوهش حاضر، بیانگر آن است که علاوه‏بر عناصر وا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده ادبیات و علوم انسانی دکتر علی شریعتی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023